数据驱动的语言学研究新路径
随着数智时代的浪潮席卷全球,语言学迎来了新的机遇和挑战(数智时代语言研究的挑战与机遇)。一方面,多语种的大规模语料库使得基于数据和实证的语言研究成为可能,这些新的材料和方法有助于解决传统方法难以解决的问题;另一方面,学科鸿沟的存在,特别是文科背景的语言研究者对处理大规模数据的畏惧,阻碍了语言学更好地服务于科学进步和社会发展。
自2006年以来,基于大规模真实语料和交叉学科方法,刘海涛教授与其合作者对人类语言在诸多层面的共性及特性展开了系统研究,相关成果大多发表在国际知名的学术刊物上。自2014年起,刘老师连续八年入选“中国高被引学者”。正如《科技日报》所评论的那样:“在计量语言学、语言复杂网络、依存语法等领域,刘海涛团队的相关研究多年来均处于国际前沿,在探索语言世界的舞台上亮起了一盏来自中国的‘明灯’(学术访谈|刘海涛教授:好奇是做研究的原动力)。”
近年来,刘老师一直在思索如何让更多国内的语言研究者认识和了解“数据驱动”的语言学研究方法、更好地参与中国语言学的科学化和国际化,《依存关系与语言网络》因此应运而生。该书精选了刘老师及合作者近二十年的研究成果,较为系统、全面地展示了以大规模依存树库为基础,围绕语言的线性结构和网络结构对语言这一“人驱复杂适应系统”所做的探索。其中包括已在相关领域得到广泛认可的“依存距离最小化”(Dependency distance minimization)和“刘-有向性”(Liu-directionality)等。
书名:《依存关系与语言网络》
书号:978-7-03-072783-1
作者:刘海涛
字数:510000
出版社:科学出版社
出版时间:2022-08
定价: ¥98.00元
内容简介
借助大规模真实语料探究人类语言的本质规律及其机制,是数智时代语言学家的主要任务之一。本书精选了笔者近年来的研究成果,较为系统、全面地展示了以大规模依存树库为基础,围绕语言的线性结构和网络结构对语言这一“人驱复杂适应系统”所做的探索,其中包括已在相关领域得到广泛认可的“依存距离最小化”和“依存方向连续统”等。全书内容丰富、结构明晰、友好易读,较好地回答了“什么是数据驱动的语言研究”、“为什么要开展相关研究”,以及“应该如何开展”等问题。
本书目录
从无序中寻找有序
写在前面的话
依存关系计量研究
第一章 依存距离和依存方向 3
第一节 依存关系的基本概念 3
第二节 依存距离作为衡量语言理解难度的计量指标 10
第三节 依存方向作为面向语序类型研究的计量指标 26
第二章 影响依存距离和依存方向的因素 39
第一节 句长 39
第二节 语体 52
第三节 标注方式 63
第三章 依存距离最小化及其形成机理 83
第一节 汉语依存距离的概率分布 83
第二节 30种语言的依存距离分布规律 90
第三节 交叉依存与依存距离的关系 103
第四节 组块在降低自然语言句法复杂度中的作用 113
第四章 依存结构的计量特征及其应用 124
第一节 汉语句法及类型特征 124
第二节 依存距离最小化与汉语的“VP+N1+的+N2”结构 131
第三节 罗曼语族语言的类型特征 136
第四节 依存距离和动态配价 145
第五节 依存结构层级的分布规律 159
第六节 依存距离与层级距离 166
第七节 依存结构树句长、树宽、树高之间的协同关系 174
语言复杂网络研究
第五章 语言网络的整体特征 187
第一节 语言是一个复杂网络 187
第二节 汉语句法网络的复杂性 201
第三节 汉语语义网络的复杂性 208
第四节 汉语音素网络的复杂性 215
第六章 现代汉语多层级复杂网络研究 224
第一节 引言 224
第二节 汉语多层级网络的构建 226
第三节 汉语四个层级网络的复杂性特征 230
第四节 从复杂网络参数看汉语层级结构特点 234
第七章 语言网络的局部特征 240
第一节 句法在语言网络中的作用 240
第二节 汉语句法网络的中心节点 243
第三节 局部句法结构与网络整体特征的关系 253
第八章 语言网络应用研究 265
第一节 基于语言网络的语言分类 265
第二节 句法网络与语言的形态复杂度 276
第三节 词同现语言网络与斯拉夫语族语言分类 285
第四节 基于句法网络和语义网络的语体分类 292
第五节 复杂网络视角的翻译研究 300
参考文献 306
附录一 从依存距离到语言学交叉学科研究 328
附录二 大数据时代的语言研究 338
附录三 数智时代的(应用)语言学杂谈 356
附录四 语言学理论研究如何应对智能时代的挑战 368
写在后面的话 382
作者简介
(识别二维码购买)